Budapesti Műszaki és Gazdaságtudományi Egyetem - BME -- Távközlési és Médiainformatikai Tanszék - TMIT BME - Távközlési és Médiainformatikai Tanszék - TMIT
 
 
| Témakiírások | | | | | IW  
 
 
Önálló labor
Kiírt témák

Webes adatfeltárás és adatkinyerés nagy nyelvi modellek (pl. GPT-4) segítségével (Web data exploration and data extraction using LLMs (e.g. GPT-4))

A projekt célja aszály kezelésének globális finanszírozását elemezni, melyet nagyrészt szövegbányászati módszerekkel valósítunk meg. Három fő részból áll a feladat: 1. nagyméretű adatbázis szűrése felügyelet nélküli módszerekkel (data filtering), 2. webes információ feltárás (potenciálisan web scraping), 3. a kapott szöveges adatok összefoglalása, releváns adatmezők kinyerése, kategorizálás (data extraction). A munka szoros együttműködésben zajlik az ENSZ Élelmezésügyi és Mezőgazdasági Szervezetével (FAO), valamint tanszéki munkatársakkal / hallgatókkal. A fenti 3 részfeladat további, különböző bonyolultságú és különböző mennyiségű munkát igénylő alfeladatokat tartalmaz, amelyek tökéletes alapot nyújtanak egy vagy akár több féléves munkához, így a projekttárgyak teljes spektrumát képesek lefedni, BSc önálló labortól egészen MSc diplomatervig. Tudományos érdeklődésű hallgatók jelentkezését is várjuk, a téma rengeteg tudományos kihívást rejt magában, melyekben elmélyedve TDK dolgozat, tudományos publikáció készíthető, valamint PhD téma kidolgozásának alapja lehet.

Kulcsszavak: NLP, GPT-4, chatgpt, deep learning, gépi tanulás, nagy nyelvi modellek, web scraping, klaszterezés, osztályozás
Témavezető: Papp Dávid
Oktatók: Papp Dávid.
A következő tantárgyakhoz javasolt:
 vitma387 (Önlab, IVIR szakirány)
 vitma415 (Szakdolgozat)
 vitma416 (Szakdolgozat)
 vitma417 (Szakdolgozat, IVIR szakirány)
 vitmal01 (Info, BSc, Önálló laboratórium)
 vitmm855 (Info, MSc, Önálló laboratórium 2, Hálózatok és szolgáltatások)
 vitmm861 (Info, MSc, Önálló laboratórium 2, Médiainformatika)
 vitmm905 (Diplomatervezés 1. (Info, Hálózatok és szolgáltatások szakirány))
 vitmm911 (Diplomatervezés 1. (Info, Médiainformatika szakirány))
 vitmml10 (Info, MSc, Önálló laboratórium 1)
 vitmml11 (Info, MSc, Önálló laboratórium 2)
 vitmm376 (Projekt labor 1)
 vitmm377 (Diplomatervezés 1 [analytics])
 vitmm379 (Önálló laboratórium 1)
 vitmm380 (Önálló laboratórium 2)
 vitmm381 (Diplomatervezés 1)
 vitmm382 (Diplomatervezés 2)
 vitmm388 (Projekt labor 2)
QR:    (mi is az?)
 
 katt. a nagyításhoz
 
Kedvencekbe felvesz   Jelentkezés